AI资讯新闻榜单内容搜索-OpenAI

长链推理表象下，大模型精细表征张冠李戴的本质

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

9085 点击 2025-03-13 14:41

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

6665 点击 2025-03-13 14:41

DeepSearch 与 DeepResearch 的设计和实现

这才 2 月份，深度搜索（Deep Search）就已经隐隐成为 2025 年的新搜索标准了。像谷歌和 OpenAI 这样的巨头，纷纷亮出自己的“Deep Research”产品，努力抢占这波技术浪潮的先机。（我们也很自豪，在同一天也发布了开源的node-deepresearch）。

来自主题: AI技术研报

8610 点击 2025-03-12 14:55

刚刚，OpenAl 发布 Agent 工具包，网友：谢谢 Manus AI

就在刚刚，OpenAI 发布了一系列专为构建 AI Agents 设计的新工具和 API，帮助开发者更容易创建能自动完成任务的 AI Agents（智能体）。

来自主题: AI资讯

9220 点击 2025-03-12 10:12

速递｜与微软再对弈，OpenAI向CoreWeave注资120亿美元

在一场激烈对决的棋局中，OpenAI 与 GPU 资源丰富的云服务提供商 CoreWeave 签署了一项为期五年、价值 119 亿美元的协议，据路透社援引接近交易的人士透露。

来自主题: AI资讯

6136 点击 2025-03-12 09:56

联网/用电脑... OpenAI 新 Agent 套件全解析（另附：发布会没说的 30+ 要点）

下面这个，不是 Manus，是 OpenAI 新货：凌晨 1 点的时候，OpenAI 发布了全套 Agent 开发套件，让手搓 Manus 触手可及。套件包含 4 个主要内容Responses API：本次发布会的核心，可视作 Chat API 的上位升级

来自主题: AI资讯

8129 点击 2025-03-12 08:32

Manus、OpenAI Deep Research 20个用例大横评，通用Agent抛弃奥特曼了。。。吗？

Manus从第一个通用Agent变成了第一款自媒体比技术从业者先发现和评测的AI产品，评论好坏掺半。最明显的两个观点是效果虚假，没有技术报告，很多好的Agent已经能做到这一点和如何那么厉害的话，为什么英文媒体们没有报道。

来自主题: AI资讯

8148 点击 2025-03-09 12:48

深度｜关于OpenAI竞对的一切，Mistral AI估值60亿美元

Mistral AI，这家法国公司是 AI 助手 Le Chat 和多个基础模型背后的力量组成，被官方视为法国最有前途的科技初创企业之一，且可以说是能与 OpenAI 竞争的欧洲公司。然而，与其 60 亿美元的估值相比，其全球市场份额仍相对较低。

来自主题: AI资讯

8030 点击 2025-03-09 10:50

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

4986 点击 2025-03-09 10:37

祝贺Manus创新的同时，也别过度脑补

Manus 今天刷屏了，我也没有拿到邀请码。看了视频，有创新，有对我产生启发，我开始思考我们的创业产品路径是不是对，会不会未来被这样的产品吃掉。进一步，也在思考，Manus 的能力会不会被 OpenAI 吃掉。

来自主题: AI资讯

6095 点击 2025-03-06 17:06